SMH-Bench: Evaluando el razonamiento de LLM en hogares inteligentes
SMH-Bench evalúa agentes LLM en hogares inteligentes con 1100 tareas. ¿Son capaces de razonar y automatizar? Descúbrelo.
SMH-Bench evalúa agentes LLM en hogares inteligentes con 1100 tareas. ¿Son capaces de razonar y automatizar? Descúbrelo.